12 research outputs found

    Localizing triplet periodicity in DNA and cDNA sequences

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>The protein-coding regions (coding exons) of a DNA sequence exhibit a triplet periodicity (TP) due to fact that coding exons contain a series of three nucleotide codons that encode specific amino acid residues. Such periodicity is usually not observed in introns and intergenic regions. If a DNA sequence is divided into small segments and a Fourier Transform is applied on each segment, a strong peak at frequency 1/3 is typically observed in the Fourier spectrum of coding segments, but not in non-coding regions. This property has been used in identifying the locations of protein-coding genes in unannotated sequence. The method is fast and requires no training. However, the need to compute the Fourier Transform across a segment (window) of arbitrary size affects the accuracy with which one can localize TP boundaries. Here, we report a technique that provides higher-resolution identification of these boundaries, and use the technique to explore the biological correlates of TP regions in the genome of the model organism <it>C. elegans</it>.</p> <p>Results</p> <p>Using both simulated TP signals and the real <it>C. elegans </it>sequence F56F11 as an example, we demonstrate that, (1) Modified Wavelet Transform (MWT) can better define the boundary of TP region than the conventional Short Time Fourier Transform (STFT); (2) The scale parameter (a) of MWT determines the precision of TP boundary localization: bigger values of a give sharper TP boundaries but result in a lower signal to noise ratio; (3) RNA splicing sites have weaker TP signals than coding region; (4) TP signals in coding region can be destroyed or recovered by frame-shift mutations; (5) 6 bp periodicities in introns and intergenic region can generate false positive signals and it can be removed with 6 bp MWT.</p> <p>Conclusions</p> <p>MWT can provide more precise TP boundaries than STFT and the boundaries can be further refined by bigger scale MWT. Subtraction of 6 bp periodicity signals reduces the number of false positives. Experimentally-introduced frame-shift mutations help recover TP signal that have been lost by possible ancient frame-shifts. More importantly, TP signal has the potential to be used to detect the splice junctions in fully spliced mRNA sequence.</p

    Determinantes das patentes em ciências da vida e da saúde nas universidades federais de Minas Gerais, Brasil: uma análise de dados em painel para o período 1995-2016

    No full text
    Na década de 1990, com o desenvolvimento da microeletrônica e das tecnologias de comunicações, emergiu o paradigma da tecnologia da informação, caracterizado pela intensidade de informação que, transformada em conhecimento e inovação, desempenha um papel crucial para o desenvolvimento. Entretanto, para que isso ocorra, é necessário que os países construam arranjos institucionais apropriados. Com isso, surge o modelo de sistemas de inovação da Tríplice Hélice, que compreende a inovação e o progresso técnico, em uma Economia do Conhecimento, como o resultado de um conjunto complexo de relações entre universidade, empresa e governo. Nesse contexto, o presente estudo tem o objetivo de identificar o impacto da produção de conhecimento e das políticas públicas para a produção de depósitos de patentes dos pesquisadores pertencentes ao domínio científico Ciências da Vida e da Saúde, no âmbito das universidades federais de Minas Gerais, Brasil. A análise considerou o período de 1995 a 2016, e utilizou técnicas de econometria em painel de dados. Os resultados mostram que fatores educacionais (orientações em pós-graduação), econômicos (produtos tecnológicos e prestação de serviços tecnológicos) e políticos (arcabouço legal, recursos financeiros e políticas de estímulo) impactam a produção de depósitos de patentes dos pesquisadores selecionados. Por meio da análise dos resultados, podem-se perceber os esforços do governo, mesmo que ainda incipientes, na tentativa de promover o salto tecnológico
    corecore